به کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوستة فارسی

نویسندگان

محمد بحرانی

حسین صامتی

چکیده

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدل های آوایی با روش های مستقل از بافت و وابسته به بافت در این سامانه به کار رفته و نتایجِ به کارگیریِ آن ها ارائه شده است. مدل زبانیِ سه کلمه ای نیز با روش های مبتنی بر کلمه، مبتنی بر مقولة نحوی و مبتنی بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامانۀ بازشناسی به کار گرفته شده است. همچنین مدل زبانیِ دستوری مبتنی بر دستور ساخت- گروهیِ تعمیم یافته در این سامانه پیاده سازی شده و نیز در ترکیب با مدل زبانیِ آماری به کار رفته است.  نتایج حاصل نشان می دهد که مدل آواییِ وابسته به بافت، مطابق انتظار، بهترین عملکرد را دارد. همچنین مدلِ زبانیِ سه کلمه ایِ مبتنی بر کلمه، نسبت به سایر روش های استخراجِ مدلِ زبانیِ آماری برتری دارد. درضمن ترکیب مدلِ زبانیِ دستوری با مدلِ زبانیِ آماری منجر به بهبود نتایجِ بازشناسی می شود. سامانۀ بازشناسیِ گفتارِ معرفی شده در این مقاله، اولین سامانۀ بازشناسی برای گفتارِ پیوستة فارسی بوده و با پشتوانۀ فعالیت های تحقیقاتیِ متعددی که برای پیاده سازیِ آن انجام شده است، قابلیت استفاده به صورت کاربردی را یافته است.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

به‌کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوستة فارسی

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می‌شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می‌گیرد. مدل‌های آوایی با روش‌های مستقل‌از‌بافت و وابسته‌به‌بافت در این سامانه به‌کار رفته و نتایجِ به‌کارگیریِ آن‌ها ارائه شده است. مدل زبانیِ سه‌کلمه‌ای نیز با روش‌های مبتنی‌بر کلمه، مبتنی‌بر مقولة نحوی و مبتنی‌بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامان...

متن کامل

پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی

Although researches in the field of Persian speech recognition  claim  a  thirty-year-old  history in Iran  which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...

متن کامل

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

متن کامل

بازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی

حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود. برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تأثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی...

متن کامل

به کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوسته فارسی

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدل های آوایی با روش های مستقل از بافت و وابسته به بافت در این سامانه به کار رفته و نتایجِ به کارگیریِ آن ها ارائه شده است. مدل زبانیِ سه کلمه ای نیز با روش های مبتنی بر کلمه، مبتنی بر مقوله نحوی و مبتنی بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامان...

متن کامل

ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار

In this article a pre-processing method is introduced which is applicable in speech recognized texts retrieval task. We have a text corpus, t generated from a speech recognition system and a query as inputs,  to search queries in these documents and find relevant documents. A basic problem in a typical speech recognized text is some error percentage in recognition. This, results erroneously ass...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
زبان و زبان شناسی

ناشر: انجمن زبان شناسی ایران

ISSN

دوره 6

شماره 11 2010

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023